Tűz ütött ki az Eiffel-toronyban, evakuálni kellett a turistákat
Káosz alakult ki a francia fővárosban.
Remek munkáz végez a Google új ideghálója, a PlaNet: pontosan azonosítja képek helyszínét.
Trükkös feladatot kell megoldanunk: találomra szedjünk le egy képet a webről, aztán semmi más, csak a kép alapján találjuk ki a helyszínt, hogy hol készült a felvétel. Ha híres épület, vízesés, például az Eiffel-torony vagy a Niagara van rajta, könnyű a dolgunk. Ha viszont a helyre utaló semmiféle fogódzót nem találunk vagy belsőben vették fel, esetleg cicát stb. látunk rajta, bonyolódik a feladat.
Pedig az ember meglepően jól teljesít ilyen teszteken. A világgal kapcsolatos összes ismeretünket felhasználjuk: milyen nyelven íródtak a jelek, mit árul el a növényzet, építészeti stílus, közlekedés stb. Egész életünket azzal töltjük, hogy efféle geolokációs kapaszkodókat gyűjtünk össze.
A gépeknek viszont meggyűlik a bajuk ezekkel a feladatokkal.
Eddig legalábbis így volt, a Google PlaNet nevű mélytanuló (deep learning) rendszere viszont szinte az összes fényképről megmondja, hol készült. És csak a kép pixeleivel dolgozik.
A kutatók 26 ezernél több változó méretű négyzetet tartalmazó hálózattal kezdték. A méret attól függ, hogy hány képet csináltak az adott helyszínről.
Ezt követően a földrajzilag lokalizált internetes képekből adatbázist alkottak, és a rendszernek a helyadatok alapján kellett meghatároznia, hogy hol készültek a hálózat adott négyzetében lévő képek.
Az adatsor 126 millió képből, kapcsolódó Exif helyadatokból állt. A kutatók 91 millió képpel tanították ideghálójukat. Mindig csak azzal a képpel dolgozhatott, amiről döntenie kellett.
Az ideghálót a maradék 34 millió képpel érvényesítették, végül földrajzi címkével ellátott 2,3 millió Flickr-képpel mérték, mennyire pontos, hogy valóban eltalálja-e a helyet. A helyszínek 3,6 százalékát utca-, 10,1 százalékát város-, 28 százalékát ország-, 48 százalékát földrész szintű-pontossággal állapította meg.